新的分类器
  1. 选择基类
WEKA中所有的分类器来说weka.classifiers.Classifier接口是最普通的。为了使得新的分类器更易于使用,WEKA还附带了一系列的引用Classifier接口的其他抽象类,下面的介绍是为了方便用户选择自己适合的抽象类。
  1. 简单分类器
-AbstractClassifier -非离散化的分类器
-RandomizableClassifier –离散化的分类器
  1. 多远分类器
-单个基本分类器
  • SingleClassifierEnhancer –非离散化,非迭代分类器
  • RandomizableSingleClassifierEnhancer -离散化的,迭代的分类器
  • IteratedSingleClassifierEnhancer -非离散化的,迭代的分类器
  • RandomizableIteratedSingleClassifierEnhancer -离散化的,迭代的分类器
- 多元分类器
  • MultipleClassifiersCombiner -非离散化的分类器
  • RandomizableMultipleClassifiersCombiner -离散化的分类器
为了适应多核计算机,WEKA提供了并行化的方法来建立分类器:
l ParallelIteratedSingleClassifierEnhancer
l ParallelMultipleClassifiersCombiner
l RandomizableParallelIteratedSingleClassifierEnhancer  (Bagging)
l RandomizableParallelMultipleClassifiersCombiner    (Stacking)
如果你仍然不能确定使用哪个基类,那你需要查询一下WEKA API文档,最后再确认你的选择。
  1. 一些可选的接口
    1. 上面列出的抽象类基本上都引用了下面两种接口中的至少一个:
      1. weka.core.Randomizable –允许随机化的操作
      2. weka.classifiers.IterativeClassifier -使得分类器可以迭代
    2. 上面的接口并不是所有的能被分类器引用的接口,下面列出一些常用的接口:
      1. weka.core.AdditionalMeasureProducer -分类器返回附加的信息,例如J48分类器返回模型数的规模。
      2. weka.core.WeightedInstancesHandler -使得分类器可以处理加权的样例
      3. weka.core.TechnicalInformationHandler -返回该方法的技术文档信息,包括发表论文及首创者。
      4. weka.classifiers.Sourcable -分类器可以返回构建模型的代码,这个接口是公开的。可以被任何用户调用。
      5. weka.classifiers.UpdateableClassifier -支持分类器增量构建模型,一个样例一个样例的构建,像NaiveBayesUpdateable分类器。